MICROSOFT EXCEL: STATISTICA DESCRIPTIVA /RECAPITULARE OBIECTIV: * Calcularea parametrilor de statistica descriptiva prin utilizarea functiilor predefinite sau functii definite de utilizator * Utilizarea functiilor predefinite: o Parametrii de centralitate: media aritmetica (AVERAGE), mediana (MEDIAN), modulul (MODE), valoarea centrala (= (Xmax + Xmin)/2) o Parametrii de dispersie: minim (MIN), maxim (MAX), amplitudinea (= Xmax - Xmin), variatia (VAR), abaterea standard (STDEV), eroarea standard (=STDEV(array)/sqrt(count(array))), coeficientul de variatie (=STDEV(array)/AVERAGE(array)) o Parametrii de localizare: cvartile (QUARTILE) o Parametrii de normalitate: asimetria (SKEW), boltirea (KURT) * Recapitulare: reprezentari grafice EXERCITIUL 1 Problema: Un medic de familie care are înscrisi pe liste un numar de 2542 pacienti a realizat un studiu pentru a identifica riscul cardiac Datorita resurselor limitate s-a recurs la alegerea aleatoare a unui esantion de 30 pacienti Urmatoarele date au fost culese din fisa pentru fiecare pacient: gen, consumul afirmativ de alcool (da/nu), fumat (da/nu, afirmativ), vârsta (ani,) Urmatoarele masuratori au fost realizate pentru fiecare pacient: greutate (kg), înaltime (cm), TAS (tensiunea arteriala sistolica, mmHg), TAD (tensiunea arteriala diastolica, mmHg) Urmatoarele determinari biochimice au fost realizate în urma recoltarii unei probe de sânge: glicemie (mg/dl) ?i colesterol (mg/dl) Datele au fost colectate si sunt prezentate în tabelul de mai jos: Gen Alcool Fumat Vârsta (ani) Greutate (kg) Inaltime (cm) TAS (mmHg) TAD (mmHg) Glicemie (mg/dL) Colesterol (mg/dL) F nu nu 27 53 162 110 80 75 168 M nu nu 41 106 176 130 70 92 343 M nu nu 67 91 170 170 100 77 229 F nu nu 60 107 168 190 120 128 157 M nu nu 26 84 174 130 90 81 161 M nu nu 46 120 182 170 90 138 192 M nu da 34 86 180 110 70 88 218 M nu nu 31 80 178 110 70 72 159 M da da 45 82 179 100 70 71 272 M nu nu 35 100 172 130 90 80 195 F nu nu 64 74 162 130 100 91 220 F nu nu 64 78 154 170 100 94 246 F nu nu 34 55 152 110 80 90 147 M nu da 35 57 173 110 70 90 157 M da nu 41 89 172 120 90 96 175 F nu nu 49 95 163 130 100 83 257 F nu nu 64 78 154 160 110 88 223 M nu nu 43 79 180 120 80 92 184 M nu nu 58 96 178 145 85 79 245 M nu nu 44 64 155 150 100 75 242 F nu nu 45 50 152 120 80 92 162 M nu da 25 71 177 130 80 96 215 F da nu 62 76 158 130 80 88 293 F nu da 39 81 158 100 70 72 197 M nu nu 26 75 176 120 80 77 219 F nu nu 41 70 162 120 80 86 225 M nu nu 30 86 173 120 80 74 178 F nu nu 49 76 165 130 80 80 152 M nu da 24 88 178 120 70 90 154 M nu da 27 88 182 130 90 88 216 Partea I - Statistica descriptiva Cerinte: 1 Copiati tabelul într-un fisier Microsoft Excel 2 Salvati fisierul Excel în folderul corespunzator temei 3 Realizati la dreapta tabelului cu date o structura tabelara de forma: 4 Calculati pentru fiecare variabila parametrii statistici descriptivi prin utilizarea functiilor Excel predefinite sau a functiilor definite de utilizator: Parametrii centralitate Media aritmetica =AVERAGE(ARRAY) Mediana =MEDIAN(ARRAY) Modulul =MODE(ARRAY) Valoarea centrala =(MAX(array)+MIN(array)) /2 Parametrii de dispersie Minim =MIN(ARRAY) Maxim =MAX(ARRAY) Amplitudinea =MAX(ARRAY)-MIN(ARRAY) Variatia =VAR(ARRAY) Abaterea standard =STDEV(ARRAY) Eroarea standard =STDEV(ARRAY)/SQRT(COUNT(ARRAY)) Coeficientul de variatie =STDEV(ARRAY)/AVERAGE(ARRAY) Parametrii de localizarea Cvartila 1 =QUARTILE(ARRAY,1) Cvartila 2 =QUARTILE(ARRAY,2) Cvartila 3 =QUARTILE(ARRAY,3) Cvartila 4 =QUARTILE(ARRAY,4) Parametrii de normalitate Asimetria =SKEW(ARRAY) Boltirea =KURT(ARRAY) 5 Realizati tabelul de frecventa pentru variabila calitativa Gen 6 Reprezentati grafic distributia pacientilor dupa Gen 7 Obtineti tabelul de contingenta a variabilei Alcool functie de variabila Gen 8 Reprezentati grafic distributia consumului de alcool în functie de Gen 9 Salvati fisierul si închideti toate aplicatiile Indicatii: * Selectati celula unde doriti realizarea calculelor înainte de a alege functia predefinita * Pentru utilizarea functiilor predefinite: [Insert - Function ] a) Alegeti categoria All În aceasta categorie veti putea gasi toate functiile predefinite de care eveti nevoie b) Selectati de exemplu functia AVERAGE (permite calcularea mediei aritmetice) În celula corespunzatoare la `Number 1` selectati referintele relative ale celulelor pentru variabila Vârsta (D3:D31) Validati cu OK pentru a obtine valoarea mediei vârstei c) Pentru a copia formula ce urmatoarele celule selectati celule care contine formula + celulele în care doriti sa compiati formula si [Edit - Fill right]: * Functii definite de utilizator: a) Orice functie începe cu semnul `=` b) Utilizam referinte relative (ex A1)/absolute (ex A$1, $A1, $A$1) de celule c) Parantezele rotunde ne ajuta sa definim ordinea operatiilor NU folosi?i paranteze drepte! d) Valoarea centrala: exemplu 1 Realizarea tabelelor de frecventa: a Utilizarea functiei predefinite COUNTIF: [Insert - Function] * Atentie! Trebuie selectata celula unde se dore?te raspunsul!!! * Range = celulele unde se gasesc datele brute * Criteria = criteriul dupa care se face numararea b Utilizarea optiunii PivotTable (vezi instruc?iunile de la Punctul 3) 2 Realizarea reprezentarii grafice: pa?i (exemplificare pe variabila Gen) a Selectam tabelul de frecventa pentru variabila Gen b [Insert - Chart] - Chart Type = Pie c Afi?ati pe reprezentarea grafica denumirea ?i frecventa relativa asociata d Reprezentarea grafica trebuie sa fie asemanatoare cu cea din figura de mai jos: 3 Realizarea tabelului de contingenta si reprezentarea grafica asociata: a [Data - PivotTable and PivotChart Report ] b Pasul 1: selectati optiunile ca si în imaginea de mai jos c Pasul 2: selectati celule unde aveti datele pentru variabila Sex si respectiv Alcool: d Pasul 3: puneti rezultatele într-o foaie de calcul noua: e Confirmati selectia prin apasarea butonului Finish Veti avea urmatoarea structura: f Selectati Gen cu clic stânga de mouse; tineti butonul apasat duceti variabila deasupra celulelor "Drop Row Fields Here": g Realizati aceeasi miscare pentru variabila Alcool dar "Drop Column Fields Here" Odata realizati acesti pasi veti avea urmatoarea structura tabelara: h Selectati oricare variabila si prin aceeasi miscare duceti datele în câmpul "Drop Data Items Here" i Copiati tabelul de contingenta într-o noua locatie în aceeasi foaie de calcul (selectati CTRL+C, va plasati unde doriti mutarea si CTRL+V) Modificati tabelul similar cu imaginea urmatoare: j Realizati reprezentarea grafica astfel încât sa obtineti un grafic asemanator cu figura urmatoare: EXERCITIUL 2 - RECAPITULARE a) Copiati într-un fisier Excel urmatoarele date: Nr Greutate (kg) Colesterol (mg/dL) HDLColesterol (mg/dL) 1 53 180 17 2 106 170 37 3 91 220 70 4 107 240 60 5 84 300 86 6 120 150 22 7 86 140 66 8 80 230 88 9 82 210 20 b) Creati la dreapta coloanei HDL Colesterol o noua variabila denumita RataColesterol Calculati pentru fiecare pacient valoarea corespunzatoare folosind urmatoarea formula: Colesterol/(HDL Colesterol) c) Utilizând functia IF identificati pentru fiecare pacient daca are sau nu Hipercolesterolemie * Creati la dreapta coloanei Colesterol o noua coloana denumita Hipercolesterolemie * Utilizati urmatorul criteriu: o valoare a colesterolului mai mare sau egala cu 240 indica prezenta hipercolesterolemie d) Salvati fisierului creat sub denumirea Problema 1 într-un folder denumit Recapitulare - 7 - 